感謝閱讀文章的讀者,初期以為每天抽出1~2小時已足夠,後來才發現創作要花更多時間撰寫(假日一到狂衝內容),調整架構、製作圖,還有些之前自己沒很懂的,需要回頭翻閱文獻,感謝看完的讀者,也感謝看了部分的,有些自己不滿意的內容會在做調整,以及整理成github,謝謝大家。
除了最經典的DQN了解與環境建置,加上離線小恐龍的練習,相信大家都已對這塊有基本認識,但除了離散控制外還有連續控制的領域DDPG,讓算法可以像是控制速度或方向盤一樣操作,而不僅是遊戲操作。有興趣的可以再去搜尋DDPG的資料,希望本系列帶來的不是結束,而是一個新領域的開始。
除了眾所皆知的無人車、無人機駕駛。筆者目前在研究強化學習在機器手臂的應用,歡迎大家有機會與我交流。除了控制外還有些超參數的設定也可用RL,不僅限於打遊戲,我相信連續決策與控制的應用會越來越廣。首要的高維資訊在決策上難以突破,再來是做simulation的部分,應用場景可否用程式碼模擬出來...還有待更多研究來突破。
有興趣一起研究這塊,或想交流的歡迎加我的line
line ID:leeivan1007
有疑問可在下方留言或寄信給我
leeivan1007@gmail.com